9 research outputs found

    Supervised classifiers to identify hate speech on English and Spanish tweets

    Get PDF
    Consistently with social and political concern about hatred and harassment through social media, in recent years, automatic hate-speech detection and offensive behavior in social media are gaining a lot of attention. In this paper, we examine the performance of several supervised classifiers in the process of identifying hate speech on Twitter. More precisely, we do an empirical study that analyzes the influence of two types of linguistic features (n-grams, word embeddings) when they are used to feed different supervised machine learning classifiers: Support Vector Machine (SVM), Gaussian Naive Bayes (GNB), Complement Naive Bayes (CNB), Decision Tree (DT), Nearest Neighbors (KN), Random Forest (RF) and Neural Network (NN). The experiments we have carried out show that CNB, SVM, and RF are better than the rest classifiers in English and Spanish languages by taking into account all features.Xunta de Galicia | Ref. ED431C 2018/50Agencia Estatal de Investigación | Ref. TIN2017-85160-C2-2-

    Modeling of learning curves with applications to POS tagging

    Get PDF
    An algorithm to estimate the evolution of learning curves on the whole of a training data base, based on the results obtained from a portion and using a functional strategy, is introduced. We approximate iteratively the sought value at the desired time, independently of the learning technique used and once a point in the process, called prediction level, has been passed. The proposal proves to be formally correct with respect to our working hypotheses and includes a reliable proximity condition. This allows the user to fix a convergence threshold with respect to the accuracy finally achievable, which extends the concept of stopping criterion and seems to be effective even in the presence of distorting observations. Our aim is to evaluate the training effort, supporting decision making in order to reduce the need for both human and computational resources during the learning process. The proposal is of interest in at least three operational procedures. The first is the anticipation of accuracy gain, with the purpose of measuring how much work is needed to achieve a certain degree of performance. The second relates the comparison of efficiency between systems at training time, with the objective of completing this task only for the one that best suits our requirements. The prediction of accuracy is also a valuable item of information for customizing systems, since we can estimate in advance the impact of settings on both the performance and the development costs. Using the generation of part-of-speech taggers as an example application, the experimental results are consistent with our expectations.Ministerio de Economía y Competitividad | Ref. FFI2014-51978-C2-1-

    Ampliar y descubrir contenidos en Inteligencia Artificial mediante el uso de agregadores de enlaces, votaciones y karma

    Get PDF
    El tener que acotar y delimitar la serie de contenidos que abordar en un curso es una dificultad a la que debemos enfrentarnos a la hora de planificar la docencia de una materia. Esto es especialmente problemático en materias ya de por sí extensas como las relacionadas con la Inteligencia Artificial y supone tener que omitir partes importantes, tanto teóricas como aplicadas, de un campo en constante evolución. En este trabajo presentamos un intento de mitigar estos problemas haciendo uso de agregadores sociales de enlaces, como digg, reddit o meneane, que permiten que los alumnos exploren por sí mismos, descubran y compartan sus impresiones respecto a aspectos de la materia Inteligencia Artificial que en las clases presenciales no se pueden tratar en profundidad. En nuestro caso hemos implantado nuestro propio agregador de enlaces proponiendo una actividad complementaria cuya evaluación ha sacado provecho de los mecanismos de reputación, o karma, en los que este tipo de herramientas sociales basan su funcionamiento

    Information retrieval and machine learning methods for academic expert finding

    Get PDF
    In the context of academic expert finding, this paper investigates and compares the performance of information retrieval (IR) and machine learning (ML) methods, including deep learning, to approach the problem of identifying academic figures who are experts in different domains when a potential user requests their expertise. IR-based methods construct multifaceted textual profiles for each expert by clustering information from their scientific publications. Several methods fully tailored for this problem are presented in this paper. In contrast, ML-based methods treat expert finding as a classification task, training automatic text classifiers using publications authored by experts. By comparing these approaches, we contribute to a deeper understanding of academic-expert-finding techniques and their applicability in knowledge discovery. These methods are tested with two large datasets from the biomedical field: PMSC-UGR and CORD-19. The results show how IR techniques were, in general, more robust with both datasets and more suitable than the ML-based ones, with some exceptions showing good performance.Agencia Estatal de Investigación | Ref. PID2019-106758GB-C31Agencia Estatal de Investigación | Ref. PID2020-113230RB-C22FEDER/Junta de Andalucía | Ref. A-TIC-146-UGR2

    Reconocimiento de patrones en bosques compartidos

    Get PDF
    Tesis doctoral en Informática realizada por Francisco J. Ribadas Pena bajo la dirección del doctor Manuel Vilares Ferro (Universidade de Vigo). El acto de defensa de la tesis tuvo lugar el 29 de noviembre de 2002 ante el tribunal formado por los doctores José Luis Freire Nistal (Universidade da Coruña), Alejandro Sobrino Cerdeiriña (Universidade de Santiago de Compostela), Antonio Bahamonde Rionda (Universidad de Oviedo), Richard F.E. Sutcliffe (University of Limerick, Irlanda) y Jean-Cêdric Chappelier (Swiss Federal Institute of Technology, Suiza). La calificación obtenida fue Sobresaliente Cum Laude por unanimidad. Se puede obtener más información de la tesis en http://coleweb.dc.fi.udc.es.PhD Thesis in Computer Science written by Francisco J. Ribadas Pena under the supervision of Dr. Manuel Vilares (Universidade de Vigo, Spain). The author was examined in November 29, 2002 by the commitee formed by Dr. José Luis Freire Nistal (Universidade da Coruña, Spain), Dr. Alejandro Sobrino Cerdeiriña (Universidade de Santiago de Compostela, Spain), Dr. Antonio Bahamonde Rionda (Universidad de Oviedo, Spain), Dr. Richard F.E. Sutcliffe (University of Limerick, Ireland) and Dr. Jean-Cêdric Chappelier (Swiss Federal Institute of Technology, Switzerland). The grade obtained was Sobresaliente Cum Laude. Further information is available at http://coleweb.dc.fi.udc.es

    Optimizaciones en el reconocimiento de patrones

    No full text
    El objetivo del trabajo es reducir los costes de evaluación de interrogaciones en sistemas de recuperación de información que integren reconocimiento de patrones. En este contexto estudiamos la aplicación de estrategias de programación dinámica en situaciones de compartición de estructuras entre patrones. Nuestra intención es mejorar el rendimiento computacional en esta clase de estrategias, a menudo valoradas por la calidad de los resultados, pero desechadas por su complejidad en favor de enfoques menos sofisticados basados en la simple indexación de términos. El trabajo incluye los primeros resultados experimentales que, aunque preliminares, sugieren su viabilidad

    Optimización en el reconocimiento de patrones

    No full text
    El objetivo del trabajo es reducir los costes de evaluación de interrogaciones en sistemas de recuperación de información que integren reconocimiento de patrones. En este contexto estudiamos la aplicación de estrategias de programación dinámica en situaciones de compartición de estructuras entre patrones. Nuestra intención es mejorar el rendimiento computacional en esta clase de estrategias, a menudo valoradas por la calidad de los resultados, pero desechadas por su complejidad en favor de enfoques menos sofisticados basados en la simple indexación de términos. El trabajo incluye los primeros resultados experimentales que, aunque preliminares, sugieren su viabilidad.Trabajo parcialmente financiado por los proyectos PGIDT99XI10502B de la Xunta de Galicia y 1FD97-0047-C04-02 Unión Europea

    Diseño de un entorno visualizado para la docencia práctica de Seguridad en Sistemas de Información

    No full text
    La posibilidad de que los alumnos de materias relacionadas con la seguridad informática puedan realizar sin restricciones prácticas sobre sistemas y redes reales tiene un valor pedagógico indudable, ya que les permite enfrentarse a situaciones reales y resolver problemas que en las clases teóricas apenas se llegan siquiera a describir. Sin embargo, estas actividades conllevan una serie de dificultades técnicas y de disponibilidad de recursos, junto con otras derivadas de la propia disposición del alumno a la hora de enfrentarse a ellas. En este trabajo describimos un entorno de prácticas basado en el uso de equipos y redes virtualizadas y en el empleo de herramientas de seguridad de código abierto, que supera parte de los problemas inherentes a la realización de ejercicios sobre sistemas reales. Presentamos también el diseño y desarrollo de una serie de actividades de laboratorio que hacen uso del entorno descrito y que pretenden promover el trabajo autónomo en la resolución de problemas relacionados con la seguridad y la protección de sistemas
    corecore